# -*- coding: utf8 -*-
import urllib2
import urllib
import time
import re
def add_func(url):
    sites=[]
    content=urllib2.urlopen(url).read()
    content=content.replace('\n',' ')
    part1_pat=re.compile(r'style="line-height:21px;">(.*?)<div class="bor-e1 table">')
    part1=re.findall(part1_pat,content)#抓取微百科部分
    parts_pat=re.compile(r'href="(.*?)">')
    siteValues=re.findall(parts_pat,part1[0])
    time.sleep(0.001)
    print (siteValues)
    return siteValues
#url=('http://fenlei.baike.com/地质学家/list')
#url=('http://fenlei.baike.com/')
#add_func(url)
